深度学习方法实现了对放射学图像进行分类的最新性能,但依赖于需要专家资源密集型注释的大型标签数据集。半监督学习和积极学习都可以用于减轻这种注释负担。但是,对于多标签医学图像分类,将半监督和主动学习方法的优势结合起来的工作有限。在这里,我们介绍了一种基于一致性的新型半监督证据活跃学习框架(CSEAL)。具体而言,我们利用基于证据和主观逻辑理论的预测不确定性来开发一种端到端的综合方法,该方法将基于一致性的半监督学习与基于不确定性的主动学习相结合。我们采用我们的方法来增强四种基于一致性的半监督学习方法:伪标记,虚拟对抗性培训,卑鄙的老师和不老师。对多标签胸部X射线分类任务的广泛评估表明,CSEAL在两个领先的半监督活跃学习基线方面取得了实质性改进。此外,班级分解的结果表明,我们的方法可以大大提高标记样品较少的稀有异常的准确性。
translated by 谷歌翻译
本文的重点是具有属性操作的图像检索问题。我们所提出的工作能够在维护其它属性时操纵查询图像的所需属性。例如,查询图像的套环属性可以从圆形到V-N颈改变,以从大型数据集中检索类似的图像。电子商务中的一个关键挑战是图像具有多个属性,用户希望操纵,并且重要的是估计每个属性的判别特征表示。所提出的fashionsearchnet-v2架构能够通过利用其弱监管的本地化模块来学习属性特定表示,该模块忽略了特征空间中属性的不相关特征,从而提高了相似度学习。网络与属性分类和三联排名损失的组合进行了联合培训,以估计本地表示。然后,基于所指的属性操纵,这些本地表示被合并成单个全局表示,其中可以通过距离度量来检索期望的图像。该方法还提供了可解释性,以帮助提供有关网络注意的额外信息。在几个数据集上执行的实验,该数据集在属性的数量方面表明FashionSearchNet-V2优于其他最先进的属性操作技术。与我们之前的工作(FashionsearchNet)不同,我们提出了几种改进了学习程序,并表明所提出的FashionsearchNet-V2可以概括为除了时尚之外的不同域。
translated by 谷歌翻译
The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.
translated by 谷歌翻译
Network intrusion detection systems (NIDSs) play an important role in computer network security. There are several detection mechanisms where anomaly-based automated detection outperforms others significantly. Amid the sophistication and growing number of attacks, dealing with large amounts of data is a recognized issue in the development of anomaly-based NIDS. However, do current models meet the needs of today's networks in terms of required accuracy and dependability? In this research, we propose a new hybrid model that combines machine learning and deep learning to increase detection rates while securing dependability. Our proposed method ensures efficient pre-processing by combining SMOTE for data balancing and XGBoost for feature selection. We compared our developed method to various machine learning and deep learning algorithms to find a more efficient algorithm to implement in the pipeline. Furthermore, we chose the most effective model for network intrusion based on a set of benchmarked performance analysis criteria. Our method produces excellent results when tested on two datasets, KDDCUP'99 and CIC-MalMem-2022, with an accuracy of 99.99% and 100% for KDDCUP'99 and CIC-MalMem-2022, respectively, and no overfitting or Type-1 and Type-2 issues.
translated by 谷歌翻译
这项研究是有关阿拉伯历史文档的光学特征识别(OCR)的一系列研究的第二阶段,并研究了不同的建模程序如何与问题相互作用。第一项研究研究了变压器对我们定制的阿拉伯数据集的影响。首次研究的弊端之一是训练数据的规模,由于缺乏资源,我们的3000万张图像中仅15000张图像。另外,我们添加了一个图像增强层,时间和空间优化和后校正层,以帮助该模型预测正确的上下文。值得注意的是,我们提出了一种使用视觉变压器作为编码器的端到端文本识别方法,即BEIT和Vanilla Transformer作为解码器,消除了CNNs以进行特征提取并降低模型的复杂性。实验表明,我们的端到端模型优于卷积骨架。该模型的CER为4.46%。
translated by 谷歌翻译
数据集对于将AI算法应用于网络物理系统(CPS)安全性至关重要。由于实际CPS数据集的稀缺性,研究人员选择使用真实或虚拟化测试台生成自己的数据集。但是,与其他AI域不同,CPS是一个复杂的系统,具有许多确定其行为的接口。仅包含传感器测量和网络流量集合的数据集可能不足以开发弹性的AI防御或进攻剂。在本文中,我们研究了捕获系统行为和交互所需的CPS安全数据集的\ emph {Elements},并提出了一个数据集体系结构,该架构有可能增强AI算法在保护网络物理系统方面的性能。该框架包括数据集元素,攻击表示和所需的数据集功能。我们将现有数据集与建议的体系结构进行比较,以识别当前局限性,并使用TestBeds讨论CPS数据集生成的未来。
translated by 谷歌翻译
滚动轴承是旋转机械的最关键组成部分。及时识别有缺陷的轴承可能会阻止整个机械系统的故障。由于机器零件的快速发展,机械状况监测场已进入大数据阶段。当使用大量数据时,手动特征提取方法的缺点是效率低下和不准确。近年来,诸如深度学习方法之类的数据驱动方法已成功用于机械智能故障检测。卷积神经网络(CNN)主要用于早期研究中,以检测和识别轴承断层。但是,CNN模型遭受了难以管理故障时间信息的缺点,这导致缺乏分类结果。在这项研究中,使用最先进的视觉变压器(VIT)对轴承缺陷进行了分类。使用Case Western Reserve University(CWRU)实验室实验数据对轴承缺陷进行了分类。该研究还考虑了除正常轴承条件外,在0负载情况下的13种不同类型的缺陷。使用短时傅立叶变换(STFT),将振动信号转换为2D时频图像。 2D时频图像用作VIT的输入参数。该模型的总体准确度为98.8%。
translated by 谷歌翻译
这项工作通过调整适合常规TSP的最新方法,使用深入的加固学习(DRL)提出了使用优先限制(TSPPC)的解决方案。这些方法共有的是基于多头注意(MHA)层的图形模型的使用。解决拾取和交付问题(PDP)的一个想法是使用异质注意来嵌入每个节点可以扮演的不同可能的角色。在这项工作中,我们将这种异质注意的概念推广到TSPPC。此外,我们适应了最近的想法,以使注意力稀疏以获得更好的可扩展性。总体而言,我们通过对解决TSPPC的最新DRL方法的应用和评估为研究界做出了贡献。
translated by 谷歌翻译
在这项工作中,我们对情感和压力环境中的文本独立扬声器验证性能进行了实证对比研究。这项工作结合了浅架构的深层模型,导致新的混合分类器。利用了四种不同的混合模型:深神经网络隐藏式马尔可夫模型(DNN-HMM),深神经网络 - 高斯混合模型(DNN-GMM),高斯混合模型 - 深神经网络(GMM-DNN)和隐藏的马尔可夫模型-Deep神经网络(HMM-DNN)。所有模型都基于新颖的实施架构。比较研究使用了三个不同的语音数据集:私人阿拉伯数据集和两个公共英语数据库,即在模拟和实际压力下的演讲(Susas)和情感语音和歌曲(Ravdess)的ryerson视听数据库。上述混合模型的测试结果表明,所提出的HMM-DNN利用情绪和压力环境中的验证性能。结果还表明,HMM-DNN在曲线(AUC)评估度量下的相同错误率(eer)和面积方面优于所有其他混合模型。基于三个数据集的平均所产生的验证系统分别基于HMM-DNN,DNN-HMM,DNN-GMM和GMM-DNN产生7.19%,16.85%,11.51%和11.90%的eERs。此外,我们发现,与两个谈话环境中的所有其他混合模型相比,DNN-GMM模型展示了最少的计算复杂性。相反,HMM-DNN模型需要最多的培训时间。调查结果还证明了EER和AUC值在比较平均情绪和压力表演时依赖于数据库。
translated by 谷歌翻译
测序技术容易出错,对下游应用程序进行纠错(EC)。需要手动配置EC工具以获得最佳性能。我们发现最佳参数(例如,k-mer大小)是依赖于工具和数据集。此外,评估给定工具的性能(即,对准速率或增益)通常依赖于参考基因组,但是质量参考基因组并不总是可用的。我们介绍了基于K-MEC的自动配置的Lerna。 Lerna首先创建未校正的基因组读取的语言模型(LM);然后,计算困惑度量以评估不同参数选择的校正读取。接下来,在不使用参考基因​​组的情况下发现产生最高对准率的那个。我们的方法的基本直觉是困惑度量与纠错后的组件的质量与组件的质量相反。结果:首先,我们表明,即使对于相同的EC工具,不同的数据集也可以对不同的数据集格变化。其次,我们使用其组件基于关注的变压器显示了我们的LM的收益。我们展示了误差校正前后困惑度量的模型的估计。校正后的困惑越低,k-mer大小越好。我们还表明,用于校正读取的对准率和组装质量与困惑强烈地呈负相关,从而实现了k-mer值的自动选择以获得更好的纠错,因此改善的组装质量。此外,我们表明我们的注意力模型对于整个管道的重大运行时间改善 - 由于并行化注意机制和JIT编译对GPU推理的使用JIT编译,因此整个管道的运行时间更快。
translated by 谷歌翻译